    Building of a speech recognition system for English

    Speech Activity and Speaker Change Point Detection for Online Streams

    Disertační práce je věnována dvěma si blízkým řečovým úlohám a následně jejich použití v online prostředí. Konkrétně se jedná o úlohy detekce řeči a detekce změny mluvčího. Ty jsou často nedílnou součástí systémů pro zpracování řeči (např. pro diarizaci mluvčích nebo rozpoznávání řeči), kde slouží pro předzpracování akustického signálu. Obě úlohy jsou v literatuře velmi aktivním tématem, ale většina existujících prací je směřována primárně na offline využití. Nicméně právě online nasazení je nezbytné pro některé řečové aplikace, které musí fungovat v reálném čase (např. monitorovací systémy).Úvodní část disertační práce je tvořena třemi kapitolami. V té první jsou vysvětleny základní pojmy a následně je nastíněno využití obou úloh. Druhá kapitola je věnována současnému poznání a je doplněna o přehled existujících nástrojů. Poslední kapitola se skládá z motivace a z praktického použití zmíněných úloh v monitorovacích systémech. V závěru úvodní části jsou stanoveny cíle práce.Následující dvě kapitoly jsou věnovány teoretickým základům obou úloh. Představují vybrané přístupy, které jsou buď relevantní pro disertační práci (porovnání výsledků), nebo jsou zaměřené na použití v online prostředí.V další kapitole je předložen finální přístup pro detekci řeči. Postupný návrh tohoto přístupu, společně s experimentálním vyhodnocením, je zde detailně rozebrán. Přístup dosahuje nejlepších výsledků na korpusu QUT-NOISE-TIMIT v podmínkách s nízkým a středním zašuměním. Přístup je také začleněn do monitorovacího systému, kde doplňuje svojí funkcionalitou rozpoznávač řeči.Následující kapitola detailně představuje finální přístup pro detekci změny mluvčího. Ten byl navržen v rámci několika po sobě jdoucích experimentů, které tato kapitola také přibližuje. Výsledky získané na databázi COST278 se blíží výsledkům, kterých dosáhl referenční offline systém, ale předložený přístup jich docílil v online módu a to s nízkou latencí.Výstupy disertační práce jsou shrnuty v závěrečné kapitole.The main focus of this thesis lies on two closely interrelated tasks, speech activity detection and speaker change point detection, and their applications in online processing. These tasks commonly play a crucial role of speech preprocessors utilized in speech-processing applications, such as automatic speech recognition or speaker diarization. While their use in offline systems is extensively covered in literature, the number of published works focusing on online use is limited.This is unfortunate, as many speech-processing applications (e.g., monitoring systems) are required to be run in real time.The thesis begins with a three-chapter opening part, where the first introductory chapter explains the basic concepts and outlines the practical use of both tasks. It is followed by a chapter, which reviews the current state of the art and lists the existing toolkits. That part is concluded by a chapter explaining the motivation behind this work and the practical use in monitoring systems; ultimately, this chapter sets the main goals of this thesis.The next two chapters cover the theoretical background of both tasks. They present selected approaches relevant to this work (e.g., used for result comparisons) or focused on online processing.The following chapter proposes the final speech activity detection approach for online use. Within this chapter, a detailed description of the development of this approach is available as well as its thorough experimental evaluation. This approach yields state-of-the-art results under low- and medium-noise conditions on the standardized QUT-NOISE-TIMIT corpus. It is also integrated into a monitoring system, where it supplements a speech recognition system.The final speaker change point detection approach is proposed in the following chapter. It was designed in a series of consecutive experiments, which are extensively detailed in this chapter. An experimental evaluation of this approach on the COST278 database shows the performance of approaching the offline reference system while operating in online mode with low latency.Finally, the last chapter summarizes all the results of this thesis

    Simultaneous regression over a large file of interrelated data: group contribution method development for organic solutes in water

    katedra: NTI; přílohy: CD-R; rozsah: 49 s. (56 087 znaků)Strukturně-příspěvková metoda se využívá pro výpočet termodynamických příspěvků funkčních skupin. Z tohoto omezeného množství funkčních skupin je složeno nepřeberné množství chemických sloučenin, u kterých nás zajímají jejich termodynamické vlastnosti. Z důvodu velkého množství těchto látek a finanční náročnosti měření jejich termodynamických vlastností se pro jejich zjišťování vyplatí používat právě strukturně?příspěvkovou metodu. Vstupy bakalářské práce byly dva hlavní programy vyvíjené na Katedře chemie TUL na výpočet strukturních příspěvků funkčních skupin. První z programů počítá termodynamické příspěvky (hydratační Gibbsova volná energie , hydratační entalpie , hydratační tepelná kapacita ) za standardních teplot a tlaků. Druhý pak bere v potaz teplotní závislosti. Dalšími vstupy byly výpočetní knihovny, které poskytují podpůrné funkce pro samotné výpočty parametrů, a vnitřně konzistentní databáze obsahující experimentální data, pomocí kterých jsou příspěvky korelovány. Tyto vstupy byly v rámci bakalářské práce optimalizovány a rozšiřovány. Jednalo se o optimalizaci kódu pro zvýšení přehlednosti zdrojových kódů programů. Další optimalizace a rozšíření byly zaměřeny na funkčnost programů a komfort cílových uživatelů, konkrétní zaměření bylo na datovou strukturu list asym obsahující příspěvky, které chce uživatel korelovat. Posledním bodem optimalizace bylo zaručení kompatibility programů i s novými verzemi softwaru Mathematica, verzemi označením vyšším než 6. V rámci testování a optimalizací programu byla také provedena simultánní korelace pro funkční skupinu COOH.Due to a large amount of chemical substances it's expensive to measure all their thermodynamic properties. But these chemical substances are composed of only few functional groups. To calculate the properties for functional groups is used group contribution method. With advantage we use these contribution to obtain thermodynamical properties of chemical substances. The main inputs for this work were two programs developed at Department of Chemistry TUL for functional group contribution calculation. The first program calculates thermodynamic contributions (Gibbs free energy of hydration , enthalpy of hydration and heat capacity of hydration ) under standard temperature and pressure. The second program uses temperature dependance. The other inputs were libraries, which contain supportive functions for calculating parameters, and internal consistent databases with experimental data used for group contributions correlation. These inputs were optimized and extended in this work. The source code optimization was designed and implemented to make it clearer for users and programmers. Further optimizations and extensions were focused on functionality of main programs and on comfort of end users, the dynamic structure asym containing currently calculated contributions was one of the goals of this functional optimization. The last part of optimizations was aimed at ensuring compatibility with new versions of Mathematica software, specifically on versions higher than 6. During testing and optimizing the programs simultaneous correlation for functional group COOH was done

    Increasing Incidence of Geomyces destructans Fungus in Bats from the Czech Republic and Slovakia

    BACKGROUND: White-nose syndrome is a disease of hibernating insectivorous bats associated with the fungus Geomyces destructans. It first appeared in North America in 2006, where over a million bats died since then. In Europe, G. destructans was first identified in France in 2009. Its distribution, infection dynamics, and effects on hibernating bats in Europe are largely unknown. METHODOLOGY/PRINCIPAL FINDINGS: We screened hibernacula in the Czech Republic and Slovakia for the presence of the fungus during the winter seasons of 2008/2009 and 2009/2010. In winter 2009/2010, we found infected bats in 76 out of 98 surveyed sites, in which the majority had been previously negative. A photographic record of over 6000 hibernating bats, taken since 1994, revealed bats with fungal growths since 1995; however, the incidence of such bats increased in Myotis myotis from 2% in 2007 to 14% by 2010. Microscopic, cultivation and molecular genetic evaluations confirmed the identity of the recently sampled fungus as G. destructans, and demonstrated its continuous distribution in the studied area. At the end of the hibernation season we recorded pathologic changes in the skin of the affected bats, from which the fungus was isolated. We registered no mass mortality caused by the fungus, and the recorded population decline in the last two years of the most affected species, M. myotis, is within the population trend prediction interval. CONCLUSIONS/SIGNIFICANCE: G. destructans was found to be widespread in the Czech Republic and Slovakia, with an epizootic incidence in bats during the most recent years. Further development of the situation urgently requires a detailed pan-European monitoring scheme

    70 s. :obr., tab., grafy +CD ROMPráce se zabývá tvorbou systému rozpoznávání řeči pro anglický jazyk z hlediska akustického a jazykového modelování. Práce má teoreticko-praktický charakter s částí věnovanou experimentům. Seznámení se základními přístupy k trénování modelů bylo hlavní náplní teoretické části. Cílem praktické části bylo shromáždění akustických, lexikálních a jazykových dat a za pomoci vhodných nástrojů navržení trénovacích skriptů. Cílem experimentální části bylo vyhodnocení natrénovaných modelů na vhodných testovacích sadách a konverze nejlepších modelů do prostředí aplikace Newton Dictate, která je založená na rozpoznávači vyvíjeném na Technické Univerzitě v Liberci

    Impact of phonetic annotation precision on automatic speech recognition systems

    The Impact of Inaccurate Phonetic Annotations on Speech Recognition Performance

    Automatic Development of ASR System for an Under-Resourced Language

